基础符号与上下标


  • 变量与下标:xi,yj,zk+1
  • 上标与幂运算:a2,bn,ekx,2i+j
  • 混合上下标:xnm,θit+1,αj()
  • 希腊字母:α,β,γ,δ,ϵ,λ,μ,σ,ω
  • 大写希腊字母:Λ,Σ,Ω,Δ

线性代数


  • 向量:x,y,w=(w1,w2,...,wn)T
  • 矩阵:A,B,XRm×n
  • 矩阵乘法:C=AB,其中 Cij=k=1nAikBkj
  • 转置:AT,(xyT)T
  • 逆矩阵:A1,(BTB)1
  • 特征值与特征向量:Av=λv

微积分


  • 导数:dydx,fxi,f(x)
  • 偏导数:Lθ,2Jwb
  • 梯度:J(θ)=(Jθ1,Jθ2,...,Jθn)T
  • 积分:abf(x)dx,Dg(x,y)dxdy,ex2dx=π

机器学习核心公式


  • 线性回归:hθ(x)=θ0+θ1x1+...+θnxn=θTx
  • 逻辑回归:hθ(x)=11+eθTx
  • 损失函数:L(y,y^)=(ylogy^+(1y)log(1y^))
  • 梯度下降更新:θj=θjηJ(θ)θj
  • softmax 函数:σ(z)i=ezik=1Kezk
  • 卷积操作:(fg)(x)=f(t)g(xt)dt

概率与统计


  • 概率分布:P(X=x),p(y|x;θ),N(μ,σ2)
  • 期望与方差:E[X],Var(X)=E[X2](E[X])2
  • 贝叶斯公式:P(A|B)=P(B|A)P(A)P(B)

复杂公式块


minθJ(θ)=1mi=1mL(hθ(x(i)),y(i))+λj=1nθj2W=argminWXWHF2+λW1[a11a12a1na21a22a2nam1am2amn][x1x2xn]=[b1b2bm]